0
沒有一條真理,可以解決人生所有的難題;也沒有一項技術(shù),可以幫助一家企業(yè)所向披靡。
金融科技行業(yè),縱使是一個簡單的項目,也需融合算法、專家經(jīng)驗、工程部署、接口打通等一系列環(huán)節(jié),才能完成一套解決方案,遠(yuǎn)不止一項單點技術(shù)就可以“打包票”。
在這個過于信仰技術(shù)的時代,知道技術(shù)能做什么固然重要,知道它不能做什么也許更重要。
為此,雷鋒網(wǎng)《AI金融評論》策劃了「AI能否解決金融剛需問題」系列選題,借同一個話題,對不同背景的受訪者、產(chǎn)品和客群各異的企業(yè)們進(jìn)行采訪,期望在不同的商業(yè)和技術(shù)認(rèn)知下捕捉觀點碰撞的火花。
在前三篇采訪中,我們采訪了冰鑒科技CEO顧凌云、慧安金科CEO黃鈴、品鈦執(zhí)行副總裁李惠科。
本系列的第四篇文章,由邦盛科技執(zhí)行副總裁王雷講述他從事「AI金融風(fēng)控」多年旅程中經(jīng)歷的有趣故事。
以下為王雷的親身經(jīng)歷:
“頭疼”的難題
一直以來,銀行對「信用卡套現(xiàn)」的行為都十分頭疼。
信用卡,本質(zhì)上是一種貸款。銀行希望貸款用于消費,而不是炒股、炒房甚至賭博。但是,現(xiàn)實生活中,很多人并沒有合規(guī)地使用這筆錢,從而衍生出了「套現(xiàn)組織」。
對于銀行來說,信用卡里的錢如果不是用于消費,而是用于投資、賭博,一是增大了這筆錢不能返還的風(fēng)險,二是違背了國家的貸款政策。
所以銀行會通過一些技術(shù)手段,對套現(xiàn)行為進(jìn)行識別、監(jiān)測。
邦盛科技之前就接到一個大型銀行的訂單,他們本身有一個在風(fēng)控領(lǐng)域積累了很長時間和經(jīng)驗的優(yōu)秀團(tuán)隊,但是還是希望在這個基礎(chǔ)上更上一層樓,于是找到我們,希望通過金融科技公司的AI能力,引入解決問題的新思路。
當(dāng)時,這家銀行已經(jīng)能很好地識別出哪些個體的行為屬于騙貸,但是對于那些變化多端、組織嚴(yán)密的“專業(yè)”騙貸團(tuán)伙,還是有些束手無策。
在項目初始階段,客戶對我們的期望很高,認(rèn)為我們一定能通過更先進(jìn)的技術(shù)和方法,通過對個體騙貸行為的分析,找到某種聯(lián)系,識別出詐騙團(tuán)伙。
那會兒,其實許多機(jī)構(gòu)還沒能達(dá)到這樣的水準(zhǔn),即使是行業(yè)里最好的金融機(jī)構(gòu)投入了大量精力,也沒能十分精準(zhǔn)的識別出這些詐騙組織。而我們又處于創(chuàng)業(yè)初期,經(jīng)驗匱乏,當(dāng)時并沒有信心能完成這個任務(wù)。
當(dāng)然,有沒有信心和做不做,是兩碼事。我們決定接受這個挑戰(zhàn)。
一口氣“抓”了幾千個犯罪團(tuán)伙
樣本,是智能風(fēng)控想要發(fā)揮作用的重要前提。
想要通過AI識別出詐騙團(tuán)伙,追本溯源,還是得從高質(zhì)量的樣本入手。
而樣本的質(zhì)量高低,很大程度上依賴于專家的經(jīng)驗。在風(fēng)控領(lǐng)域,專家的經(jīng)驗是比AI能力更稀缺、更重要的資源。比如薅羊毛是怎么薅的、什么樣的行為是薅羊毛,專家會通過多年積累的經(jīng)驗和規(guī)則去識別哪些行為是“薅羊毛”、哪些行為屬于盜卡、哪些是洗錢、哪些屬于申請欺詐等等。
我們團(tuán)隊中的優(yōu)秀專家對這家銀行的樣本進(jìn)行了分析,發(fā)現(xiàn)它們的樣本質(zhì)量不是非常好。
于是專家們通過在風(fēng)控領(lǐng)域多年的經(jīng)驗,對樣本進(jìn)行了加工,獲得了一些我們認(rèn)為比較好的樣本。在此基礎(chǔ)之上,我們使用了機(jī)器學(xué)習(xí)建模平臺和關(guān)聯(lián)圖譜平臺,把可疑的個人和團(tuán)伙都甄別出來。
那次,我們團(tuán)隊幾個人在兩個多月的時間里,揪出了大幾千個「信用卡套現(xiàn)團(tuán)伙」,幾千個賬戶,并查出幾十萬張有問題的信用卡。
經(jīng)過那段時間的不斷探索后,我們對整個行業(yè)的理解有一種豁然開朗的感覺。
之前,我們在沒有開始做“識別套現(xiàn)團(tuán)伙”的工作時,認(rèn)為這是一件很難的事。但下一次在做其他的事情,我覺得是可以解決的,而且思路非常清晰。
其實,那次項目因為涉及到的銀行體量非常大,我們面臨的風(fēng)險和壓力也非常大。
但是我們頂住了壓力,積累了許多欺詐團(tuán)伙的特征和畫像,并對模型進(jìn)行進(jìn)一步的優(yōu)化。
后來這家銀行通過我們提供的線索進(jìn)行了調(diào)查,確定了這些人的確屬于套現(xiàn)團(tuán)伙,并降低了他們的信用卡額度,并對部分信用卡進(jìn)行鎖卡處理,效果非常好。
也是因為這次經(jīng)歷,我對AI在「風(fēng)控領(lǐng)域」的應(yīng)用價值,有了更直觀的認(rèn)識,使得我對AI在風(fēng)控場景下的應(yīng)用,更加有信心。
如今,邦盛科技為這家國有大行做了一個更大的項目,一個包含申請反欺詐、電子渠道交易反欺詐等全方位、全行級的反欺詐系統(tǒng)。
而“識別套現(xiàn)團(tuán)伙”成為了整個大型項目中的一個組成部分,繼續(xù)為這家銀行提供服務(wù)。
抓住銀行的心
思之所想、解其所憂,才能抓住一個人的心。
同理,想要獲得銀行大單,首先要認(rèn)識它,然后解決它做夢都想解決的問題。
在和銀行客戶打交道時,不一定所有時間、所有產(chǎn)品,它都會覺得滿意。這時,我們需要對項目的效果進(jìn)行量化,沉浸到它的角度思考問題,讓它信任你。
因此,我們會時時刻刻追蹤AI產(chǎn)品的效果,并制定一系列可以看得見、摸得著的指標(biāo),讓它對我們工作的效果有一個清晰的認(rèn)識,建立信任感。
比如攔截非法金額數(shù)目、對客戶的干擾率程度、風(fēng)險等級,我們會把這些有關(guān)風(fēng)控的數(shù)據(jù)或者結(jié)果記錄下來,作為統(tǒng)計最終模型好與壞的一個標(biāo)準(zhǔn)。
我們一般建議客戶,三個月或者是六個月調(diào)整或者優(yōu)化一次模型。頻繁的調(diào)整,不是銀行的風(fēng)格。
對于銀行等金融機(jī)構(gòu)來講,“穩(wěn)定”壓倒一切,其次才是改善。所以,他們對新技術(shù)的應(yīng)用也是比較謹(jǐn)慎的。
銀行不會輕易改變自己現(xiàn)有的風(fēng)控方法,因為改變意味著不確定的風(fēng)險。只有觀察到技術(shù)和效果真的十分穩(wěn)定,他們才會采用新的技術(shù)系統(tǒng)。
AI在信貸領(lǐng)域主要防控兩種風(fēng)險,一種是欺詐風(fēng)險,另一種是我們常見的信用風(fēng)險,比如我們年輕人十分熟悉的“芝麻信用”和“微信支付分”。
一筆貸款的發(fā)放,銀行得先判斷它是否是有欺詐的風(fēng)險,然后再判斷它信用風(fēng)險的高低。
首先,金融機(jī)構(gòu)最擔(dān)心的事兒是被騙子欺詐,把貸款放給了騙子。
當(dāng)通過反欺詐技術(shù)將騙子拒之門外后,銀行還要擔(dān)心普通人能否正常還錢。普通人也有可能因為做生意經(jīng)營不善、丟了工作或者社會環(huán)境的改變等因素,還不上錢,所以要判斷他們的信用風(fēng)險。
在評估信用風(fēng)險上,「評分卡模型」是可解釋性非常好、也很穩(wěn)定的一個模型,現(xiàn)階段也使用的非常多,各家銀行都是比較習(xí)慣使用這種傳統(tǒng)的方式。所以,我們在這一領(lǐng)域,需要我們金融科技公司技術(shù)能力的場景并不多。
而在反欺詐領(lǐng)域,越來越多的金融機(jī)構(gòu)開始接受機(jī)器學(xué)習(xí)模型。因為欺詐行為更具有隱蔽性,欺詐風(fēng)險比信用風(fēng)險更難以控制。
而且業(yè)內(nèi)一般需要六個月來訓(xùn)練控制風(fēng)險的模型,上線模型至少又得三個月,加起來就是九個月。在這段時間里,整個市場的欺詐形式是會發(fā)生很大變化的,欺詐團(tuán)伙發(fā)現(xiàn)金融機(jī)構(gòu)會欺詐行為進(jìn)行防控后,他們還會變換手法。
針對這樣的情形,邦盛科技專門在模型訓(xùn)練中設(shè)立了一個環(huán)節(jié)——特征工程。在這個環(huán)節(jié)中,我們盡量呈現(xiàn)出更多的特征,我們將幾千到上萬個特征輸入到一個模型中,使它覆蓋更多的可能性,雖然不能徹底解決問題,但通過這樣的算法調(diào)優(yōu),欺詐行為的成本會越來越高。
此外,銀行需要考慮自己所用的技術(shù),是否符合監(jiān)管政策的要求。
機(jī)器學(xué)習(xí)這類技術(shù),最大的一個問題是不透明、不可解釋。它使用的是非線性的算法,當(dāng)模型說貸款可以放,但是它推理的過程是不可逆、也不可用文字解釋的,這樣在使用過程中就會受到一些限制。
模型本身是一個算法的配合,我們也在嘗試通過一些技術(shù)方式,來增強(qiáng)模型的解釋性。
AI不是萬能的
邦盛科技從創(chuàng)業(yè)初始,到如今與中國農(nóng)業(yè)銀行、中國建設(shè)銀行、招商銀行等多家大型銀行合作,對行業(yè)的理解也是經(jīng)歷了一個從無到有的過程。
但是AI也存在很多不能解決的問題。
剛剛提到AI風(fēng)控效果的好壞取決于樣本。在欺詐等場景中,樣本天然比較充足,而信用卡盜刷、賬戶盜用等場景下,因為銀行的防控力度比較強(qiáng),發(fā)生的案件數(shù)量較少,能積累到的樣本也就較少,使得智能風(fēng)控的效果也是參差不齊。
現(xiàn)在,機(jī)器學(xué)習(xí)和AI應(yīng)用在金融的各個領(lǐng)域都在嘗試,但是每個銀行對樣本積累的重視程度也不一樣,所以有的做的比較好,有的做的一般。
目前我們對樣本的依賴程度過高,所以業(yè)內(nèi)很多公司也都在嘗試無監(jiān)督或者半監(jiān)督的技術(shù)方式。
有監(jiān)督就是有樣本,無監(jiān)督就是無樣本,半監(jiān)督就是樣本質(zhì)量不夠高。
有監(jiān)督的樣本,是團(tuán)隊從業(yè)務(wù)中一點點積累下來,通過規(guī)則體系和專家經(jīng)驗,輸入到模型,然后模型跑起來。
采用無監(jiān)督的方式,一般是因為團(tuán)隊沒有積累樣本,又沒有這個領(lǐng)域的專家,于是依靠純粹的算法,通過聚合量、聚類等數(shù)理關(guān)系,找出高風(fēng)險的金融交易,提取這些異常的樣本后讓專家判斷。無監(jiān)督的流程是先通過模型得出結(jié)果,讓人來判斷,然后模型再根據(jù)人的判斷的結(jié)果去優(yōu)化。
在實踐中,我們不管用哪種技術(shù)方法,我們都會建議客戶采用綜合的解決方案,而不是單一的AI產(chǎn)品,這套解決方案包含著專家經(jīng)驗、規(guī)則體系、模型體系、圖譜體系、大數(shù)據(jù)計算等,這些元素必須結(jié)合在一起才能形成解決問題的合力。
社會上大部分的問題本身,都是一個很復(fù)雜的東西,它需要系統(tǒng)化的思路方法和技術(shù)才能解決,我們不能單一地認(rèn)為依賴于某一個高新技術(shù)就能解決所有問題。
我們每年會招很多新人進(jìn)來,也會接觸到很多新入行的創(chuàng)業(yè)者,我整體的感覺是,大家有點過于迷信技術(shù),迷信高端的算法。
任何一個技術(shù)的應(yīng)用,都有前提條件,比如數(shù)據(jù)環(huán)境、樣本質(zhì)量。每一次對AI模型的調(diào)整,少則三個月,多則幾年,運營的成本也非常高。
如果環(huán)境條件不允許,技術(shù)就很難達(dá)到大家期望的狀態(tài)。
所以對于很多這些新入行的優(yōu)秀人才,我建議先對這個領(lǐng)域有一個比較深刻的業(yè)務(wù)理解,看看沒有能力給技術(shù)創(chuàng)造出一個好的環(huán)境出來。
沒有對業(yè)務(wù)足夠深刻的理解,不能把沒有達(dá)到期望的數(shù)據(jù)轉(zhuǎn)化成高質(zhì)量的樣本,模型很難運轉(zhuǎn)起來。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。